1 00:00:00,734 --> 00:00:02,767 [موسیقی] 2 00:00:03,790 --> 00:00:04,840 [اعلان کنندہ] یہ عوامی وسائل ہے۔ 3 00:00:07,834 --> 00:00:10,599 [کارل مالامود] ہیلو ، میں کارل مالامود ہوں۔ 4 00:00:10,599 --> 00:00:12,960 جنرل انڈیکس میں خوش آمدید۔ 5 00:00:12,960 --> 00:00:20,050 ہم یہاں آپ کے مفت اور لامحدود کے لیے پیش کرتے ہیں۔ 107 ملین سے نکالے گئے این گرام کا ایک سیٹ استعمال کریں ، 6 00:00:20,050 --> 00:00:24,790 233 ہزار ، 728 جرنل مضامین۔ 7 00:00:24,790 --> 00:00:29,970 این گرام کی حد واحد الفاظ سے ہے ، جو کہ جانا جاتا ہے۔ بطور یونی گرام ، دو لفظی جملے (بگگرام) 8 00:00:29,970 --> 00:00:33,840 5 لفظوں کے جملے ، 5 گرام کے نام سے جانا جاتا ہے۔ 9 00:00:33,840 --> 00:00:40,440 یہاں سب کو بتایا گیا ہے کہ 355 ارب قطاریں ن گرام کی ہیں۔ جنرل انڈیکس کی اس ریلیز میں ، ہر ایک۔ 10 00:00:40,440 --> 00:00:43,910 ایک جریدے کے مضمون میں ایک ہٹ کے مطابق۔ 11 00:00:43,910 --> 00:00:50,579 نکالنے کے لیے اسپیسی نامی ایک ٹول کٹ استعمال کیا گیا۔ این گرام ، جسے ہم نے تقسیم کیا ہے۔ 12 00:00:50,579 --> 00:00:51,700 سولہ فائلوں میں. 13 00:00:51,700 --> 00:00:56,820 ہر صف سے وابستہ ایک md5 ہیش ہے ، جو ایک جریدے کے مضمون کی نمائندگی کرتا ہے۔ 14 00:00:56,820 --> 00:01:00,350 اس کے علاوہ ، ہم تعدد کی فہرست دیتے ہیں۔ مضمون میں ن گرام۔ 15 00:01:00,350 --> 00:01:05,850 ہم امید کرتے ہیں کہ وقت کے ساتھ ساتھ تعدد بھی درج کریں۔ مجموعی کارپورس میں ، ایک مطابقت میٹرک۔ 16 00:01:05,850 --> 00:01:08,600 TD/IDF کے نام سے جانا جاتا ہے۔ 17 00:01:08,600 --> 00:01:14,450 ن گرام کے علاوہ ، جنرل انڈیکس۔ یاک کا استعمال کرتے ہوئے نکالے گئے مطلوبہ الفاظ پر مشتمل ہے۔ 18 00:01:14,450 --> 00:01:20,320 ٹول کٹ ییک “ٹیکسٹ شماریاتی پر منحصر ہے۔ واحد دستاویزات سے نکالی گئی خصوصیات۔ 19 00:01:20,320 --> 00:01:24,190 متن کے سب سے اہم مطلوبہ الفاظ منتخب کریں۔ 20 00:01:24,190 --> 00:01:29,890 جنرل انڈیکس کلیدی جدولوں پر مشتمل ہے۔ کل 19 ارب مطلوبہ الفاظ۔ 21 00:01:29,890 --> 00:01:36,530 آخر میں ، عام انڈیکس میں میٹا ڈیٹا ہوتا ہے۔ ٹیبل ، md5 ہیش کو اس طرح کی اشیاء پر نقشہ بنانا۔ 22 00:01:36,530 --> 00:01:42,130 ایک جریدے کے مضمون کے لیے DOI کا منفرد پتہ ، عنوان ، مصنف اور جریدہ 23 00:01:42,130 --> 00:01:47,000 یہ عام انڈیکس کی ابتدائی ریلیز ہے ، ایک کام جاری ہے 24 00:01:47,000 --> 00:01:49,900 کچھ معاملات میں ، متن نکالنا ناکام ہو گیا۔ 25 00:01:49,900 --> 00:01:54,450 بعض اوقات ، میٹا ڈیٹا دستیاب نہیں ہے ، یا ہے۔ شاید غلط بھی. 26 00:01:54,450 --> 00:01:59,830 جبکہ بنیادی کارپس بڑا ہے ، یہ ہے۔ مکمل نہیں ، اور تازہ ترین نہیں ہے۔ 27 00:01:59,830 --> 00:02:04,430 اس کو بہتر بنانے کے کئی طریقے ہیں ، اور ہم جنرل بنانے کے منتظر ہیں۔ 28 00:02:04,430 --> 00:02:07,369 انڈیکس وقت کے ساتھ بہتر ہوتا ہے۔ 29 00:02:07,369 --> 00:02:13,260 جنرل انڈیکس تقریبا approximately 38 پر قابض ہے۔ ڈیٹا کی ٹیرابائٹس پوسٹگریس کی شکل میں۔ 30 00:02:13,260 --> 00:02:20,010 ڈمپ ، تاہم کمپریشن کے ساتھ ، یہ ASCII۔ ڈیٹا 8.5 ٹیرا بائٹس تک کم ہو گیا ہے۔ 31 00:02:20,010 --> 00:02:25,139 آپ یہاں سے براہ راست ڈیٹا ڈاؤن لوڈ کرسکتے ہیں ، یا بٹورینٹ جیسے ٹولز استعمال کریں۔ 32 00:02:25,139 --> 00:02:31,540 آئینے یا دیگر عوامی بنانے کے لیے بلا جھجھک۔ ذخیرے عام انڈیکس کو دوبارہ تقسیم کرنے کے لیے۔ 33 00:02:31,540 --> 00:02:37,689 ہماری امید ہے کہ اسے ایک نمبر پر رکھا جا سکتا ہے۔ استعمال کے. ہم پوسٹگریس ڈیٹا بیس استعمال کر رہے ہیں ، 34 00:02:37,689 --> 00:02:42,919 اور عام انڈیکس کو تلاش کرنے کے لیے استعمال کریں۔ ماسٹر لسٹ سے پودوں کے نام 35 00:02:42,919 --> 00:02:48,219 انڈیکس کو دوسرے کی تلاش کے لیے استعمال کیا جا سکتا ہے۔ اشیاء ، جیسے کیمیکل ، مختلف قسم کے جین۔ 36 00:02:48,219 --> 00:02:54,300 انکوڈنگ ، پروٹین ، مواد ، جگہ کے نام ، یا دیگر ادارے 37 00:02:54,300 --> 00:03:00,129 پوسٹگریس ڈیٹا بیس کی بجائے دوسری تکنیک ، جیسا کہ بی ای آر ٹی ، ڈیٹا پر لاگو کیا جا سکتا ہے۔ 38 00:03:00,129 --> 00:03:05,909 یہ ایک تلاش کا آلہ ہے ، علم کی لغت ، علم کا نقشہ ، ایک ایسا آلہ جس پر ہم یقین رکھتے ہیں۔ 39 00:03:05,909 --> 00:03:10,500 مشق کے لیے ایک ضروری سہولت ہے۔ ہمارے جدید دور میں سائنس 40 00:03:10,500 --> 00:03:16,919 علم کا یہ عمومی اشاریہ نہیں بنتا۔ بنیادی کارپورس دستیاب ، بلکہ ، حقائق۔ 41 00:03:16,919 --> 00:03:19,099 کارپس سے نکالا جاتا ہے۔ 42 00:03:19,099 --> 00:03:23,599 یہ ایک غیر مصدقہ ہے۔ اور تبدیلی کا استعمال 43 00:03:23,599 --> 00:03:28,569 ہم اسے ایک عوامی افادیت کے طور پر دیکھتے ہیں۔ جنرل انڈیکس پر کوئی ملکیت نہیں۔ 44 00:03:28,569 --> 00:03:35,599 یہ پبلک ڈومین ، ایک سیریز کے لیے وقف ہے۔ غیر منقولہ حقائق جن سے آپ کر سکتے ہیں۔ 45 00:03:35,599 --> 00:03:37,019 تم جو چاہو کرو. 46 00:03:37,019 --> 00:03:40,220 کوئی حقوق محفوظ نہیں ہیں۔ 47 00:03:40,220 --> 00:03:46,510 دریافت کے راستے پر علماء مشورہ کر سکتے ہیں۔ زیادہ تیزی سے منزلیں تلاش کرنے کا یہ روڈ میپ۔ 48 00:03:46,510 --> 00:03:52,540 وہ ملاحظہ کرنا چاہتے ہیں۔ دنیا کے وسیع ذخیرے کے دالان ، 49 00:03:52,540 --> 00:03:58,769 علماء اور سائنسدانوں کی اجتماعی جماعت اور انجینئر اور فنکار جنہوں نے تخلیق کیا ہے۔ 50 00:03:58,769 --> 00:04:01,370 یہ علم کے مندر 51 00:04:01,370 --> 00:04:08,219 یہ مندر ، اسکندریہ کی لائبریری سے۔ راہبوں سے ، الیگزینڈرا کی لائبریری میں۔ 52 00:04:08,219 --> 00:04:14,239 آئرلینڈ کی وسیع جدید ریسرچ لائبریریوں میں۔ آج کے ، عرب اور یہودی لکھاریوں سے۔ 53 00:04:14,239 --> 00:04:19,910 حکمت کے گھر کی تعمیر کے لیے مل کر کام کرنا۔ بغداد میں علم کے کارخانوں میں۔ 54 00:04:19,910 --> 00:04:25,071 جدید مشرقی ہندوستانی تجارتی گھروں میں جیسے۔ آکسفورڈ اور کیمبرج کے پریس ، یہ۔ 55 00:04:25,071 --> 00:04:30,400 وہ منزلیں ہیں جہاں علماء کو ضرور جانا چاہیے۔ ان کے ہنر کو آگے بڑھانا ، سیکھنا۔ 56 00:04:30,400 --> 00:04:31,950 وہ جو ہمارے سامنے آئے 57 00:04:31,950 --> 00:04:37,190 ان مندروں میں تمام علم کا مجموعہ ہوتا ہے ، لیکن ہمیں اس علم کو تلاش کرنے کے قابل ہونا چاہیے۔ 58 00:04:37,190 --> 00:04:39,500 عام انڈیکس ایک نقشہ ہے۔ 59 00:04:39,500 --> 00:04:44,630 یہ تمام انسانی علم کے مجموعے کا نقشہ نہیں ہے ، 60 00:04:44,630 --> 00:04:46,410 لیکن یہ یقینی طور پر ایک اہم سب سیٹ ہے۔ 61 00:04:46,410 --> 00:04:51,960 علم میں اضافے اور پھیلاؤ کے لیے۔ جاری رکھنا ، اگر ہم کندھوں پر کھڑے ہوں۔ 62 00:04:51,960 --> 00:04:56,520 جنات میں سے ، ہمیں یہ نقشے اس کو فراہم کرنے چاہئیں۔ خیالات کی وسیع دنیا 63 00:04:56,520 --> 00:05:02,670 عام انڈیکس صرف ایک آلہ ہے ، ایک آلہ ہے۔ کہ ہم امید کرتے ہیں کہ وقت کے ساتھ معیار میں اضافہ ہوگا۔ 64 00:05:02,670 --> 00:05:08,250 اور دائرہ کار میں ، ایک ایسا آلہ جو ہمیں امید ہے کہ فراہم کرے گا۔ ایک مفید شراکت 65 00:05:08,250 --> 00:05:09,460 آپ کی سائنس کی مشق کے لیے 66 00:05:09,460 --> 00:05:14,121 ہم امید کرتے ہیں کہ آپ اس جنرل انڈیکس کو بھی رکھیں گے۔ حیرت انگیز استعمال ، کہ ہم انڈیکس بنا سکتے ہیں۔ 67 00:05:14,121 --> 00:05:19,670 بہتر ، کہ آپ دوسرے ٹولز بنا سکتے ہیں ، وہ۔ علماء کی جماعت مل کر کام کر سکتی ہے۔ 68 00:05:19,670 --> 00:05:24,910 وسیع گہرائیوں کی کان کنی کی مشترکہ جستجو میں۔ سیکھنے کے اس سمندر سے 69 00:05:24,910 --> 00:05:30,160 میرا ماننا ہے کہ ہم سب ایک مشترکہ مقصد رکھتے ہیں ، ایک مشترکہ امید. 70 00:05:30,160 --> 00:05:35,660 بطور سائنسدان ، دانشور ، فنکار ، ادیب ، دنیا کے شہریوں کے طور پر ، بچوں کی خواہش کے طور پر 71 00:05:35,660 --> 00:05:41,770 سیکھنا ، بطور شوقین انسان ، میرا یقین ہے۔ ہم سب امید کرتے ہیں کہ اضافہ اور پھیلاؤ۔ 72 00:05:41,770 --> 00:05:47,100 علم ہماری دنیا کو بہتر بنائے گا۔ جگہ ، کہ اس سے ہمیں ہماری بات سمجھنے میں مدد ملے گی۔ 73 00:05:47,100 --> 00:05:53,110 دنیا ، بیماری اور غربت کا علاج کرنے کے لیے ، آگے بڑھنے کے لیے۔ سائنس اور تجارت کی ترقی اور 74 00:05:53,110 --> 00:05:55,000 انسانیت اور فنون 75 00:05:55,000 --> 00:06:01,140 سائنس ایک ایسی زبان ہے جسے ہم سب کو بولنا چاہیے۔ ہمیں اپنی دنیا کو بہتر بنانا ہے۔ 76 00:06:01,140 --> 00:06:03,620 سننے کے لیے شکریہ. 77 00:06:03,620 --> 00:06:11,890 [مہر بھونک رہی ہے] 78 00:06:11,890 --> 00:06:13,950 [موسیقی]